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ABSTRACT: Over the course of the last decade, 
there have been several improvements in the 
performance of Boolean Satisfiabilty (SAT) 
but just a few works focused on Planning as 
Satisfiability recently. This paper explores a new 
way to modela planning instance from BLACKBOX 
and SATPLANOS. This new approach is a mixed- 
horn formula (MHF) where it can be seen as a 
conjunction of a Horn formula and a 2-CNF 
formula. The theoretical complexity to solve an 
MHF is 0(2º524m). With the theoretical complexity 
combined with improvements of SAT solvers, it 
is a promising approach to model Planning as 
Mixed-Horn Formulas Satisfiability. It is observed 
that this formulation has some improvements with 
current state-of-the-art SAT solvers. 
KEYWORDS: Planning, Satisfiability, Mixed-horn 
formula, Satplan. 
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SATISFIABILITY 


PLANEJAMENTO COMO 
SATISFATIBILIDADE DE FÓRMULAS 
HORN-MISTAS 
RESUMO: Ao longo da última década, 
houveram diversas melhorias no desempenho 
dos resolvedores de Satisfabilidade Booleana 
(SAT), mas poucos trabalhos em Planejamento 
como Satisfabilidade exploraram essas novas 
estratégias. Este artigo explora uma nova maneira 
de modelar uma instância de planejamento 
do BLACKBOX e SATPLANO6. Esta nova 
abordagem é transformar a codificação padrão 
em uma fórmula Horn-Mista (MHF), que pode ser 
separada como uma conjunção de uma fórmula 
de Horn e uma fórmula 2-CNF. A complexidade 
teórica para resolver uma MHF é O(2º5284m), A 
complexidade teórica da MHF combinada com 
as melhorias dos resolvedores SAT leva a uma 
abordagem promissora, conforme observamos 
nos benchmarks, quando comparada com 
a formulação padrão utilizando os mesmos 

resolvedores SAT. 
PALAVRAS-CHAVE: Planejamento, 
Satisfatibilidade, Fórmula Horn-Mista, Satplan. 


11 INTRODUCTION 


Planning in Artificial Intelligence is an 
important field of study and an interesting 
application of Satisfiability to solve generic 
search problems. The planning problem has the 
objective to find a sequence of actions from an 
initial state to reach a given goal. These actions 
sequences and state sequences attained from 
actions taken corresponds to assignmenis of a 
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propositional formula which can be easily generated from the problem description. 

In (KAUTZ; SELMAN, 1992) it is proposed a way to solve planning problems using 
propositional Satisfiability (SAT), but only after 1996, they demonstrated that modern SAT 
solvers and better translations provided a competitive approach to planning (KAUTZ; 
SELMAN, 1996). 

SATPLAN is the planner based on SAT and one of the most successful approaches 
to STRIPS planning. This approach translates a planning problem to SAT problems, one 
formula to each horizon of actions applied. The first satisfiable formula means that a plan 
was found. 

The efficiency of SAT solver is one of the most important characteristics to the success 
of this logical approach to the planning problem. Consequently, encoding the problem is 
also important, because the information represented can make the solver work better. 

SATPLANO6 construcis a planning graph in a GRAPHPLAN fashion then translates 
this graph to a set of clauses (CNF) to be solved by a SAT Solver (BLUM; FURST 1995). 
While the generated formula is UNSAT, the graph is expanded. When the formula is SAT, 
the valuation found is translated to the solution of the original planning problem. 

The classical translation of planning to satisfiability is using axioms generated 
from the planning graph. The choice of axioms leaves different encodings with different 
characteristics, as presented by Sideris and Dimopoulos (2010). 

While solving time is highly dependentofthe SAT solvers, due to better implementation 
and better solver choices such as: branching heuristics, learning and restart strategies, 
among others; the way of generating the formula is very important to achieve better solving 
time, while itis common sense that a minimal formula is better, this is not always the case for 
current solvers as briefly discussed in (PRESTWICH, 2009). Also, Hooker (2007) suggests 
that Constraint Programming and Operational Research, in which SAT exchanges ideas 
and techniques, are Empirical Science and encoding of the problem have to be considered 
when solving a problem. 

In this paper, we show that a planning problem can be translated to a Mixed- 
Horn Formula (MHF) instance, to be solved by a specific SAT solver. MHFs are formulas 
composed of 2-CNF positive formulas and Horn formulas. It was demonstrated by Porschen 
and Speckenmeyer (2007) that SAT in MHF is 0(2º52*), still NP-Complete, but theoretically 
better than general CNF SAT. 

This paper is organized as follows. In section 2 we present theoretical foundations 
and background information of SAT, planning, and MHF. In section 3 we show the proposed 
translation of a planning problem in MHF SAT, based on available SATPLAN encodings 
followed by section 4 where we show preliminary results encoding planning problems in 
MHF-. Finally, in section 5 we present the conclusion and future work. 
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21 THEORETICAL FOUNDATIONS AND BACKGROUND 


2.1 Boolean Satisfiability 


In Boolean Logic, a formula is said to be in the Conjunctive Normal Form (CNF) if 
it is formed by a sequence of conjunctions, represented by “A” consisting of one or more 
clauses. Each of these clauses should be a disjunction, represented by “v” of one or more 
literals. A literal is a symbol or the negation of it, used to represent a Boolean statement 
in logic that can take the value either True or False. All conjunctions of literals and all 
disjunctions of literals are in CNF, as they can be seen as conjunctions of one-literal clauses 
and conjunctions of a single clause, respectively. As mentioned, the only propositional 
connectives in a CNF formula are “N” “v” and “= 

Given an assignment to the literals in a CNF formula, the formula is satisfied if all 
of its clauses are satisfied and a clause is satisfied iff at least one of its literals is satisfied. 
A positive literal is satisfied /ff the corresponding variable is assigned value True and a 
negative literal is satisfied iffthe corresponding is assigned to False. 

The problem of deciding whether a CNF (Boolean) formula is satisfiable, i.e if there 
exists an assignment to the variables such that the formula is satisfied, is called Boolean 
Satisfiability (SAT). SAT was the first problem that was proved to be NP-complete (COOK, 
1971). 

A detailed description of modern SAT solvers, techniques, and CNF encodings 
can be found, respectively in (DARWICHE; PIPATSRISAWAT, 2009), (MARQUES-SILVA; 
LYNCE; MALIK, 2009) and (PRESTWICH, 2009). 


2.2 Planning 


A planning problem, in the reasoning about actions area, is defined as the problem 
to discover a sequence of actions that goes from an initial situation to reach a goal state. 
According to Weld (1999), an algorithm that solves these kinds of problems must receive 


as input: 
* | A description of world entities and actual situation; 
* A description of goals; 
* | A description of allowed actions. 


These algorithms return a sequence of actions that reach a goal state from a starting 
state. 

Planning problems were computationally modeled by Fikes and Nilsson (1971), 
where they proposed a formal representation that could solve the problem, in conjunction 
with a search algorithm. This approach is known as STRIPS. Despite the simplicity of 
STRIPS, planning was proved PSPACE-Complete in (BYLANDER, 1994). 

The first algorithm that solves planning with satisfactory performance was SATPLAN 
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(KAUTZ; SELMAN, 1992) (KAUTZ; SELMAN,1996), which translates the planning problem 
to satisfiability (SELMAN; LEVESQUE; MITCHELL,1992) (SAT). 

In (BLUM; FURST,1995) a new approach is presented, resulting in a new planner 
called GRAPHPLAN. This approach represents the planning problem as a planning graph 
and the resolution is using a backward search. In (KAUTZ; SELMAN, 1999) SAT-based 
and graph-based approaches were united, resulting in a smaller instance compared to the 
generated from GRAPHPLAN, it was called BLACKBOX. 

In 2004, Kautz and Selman submitted to the 2004 International Planning Competition 
(IPC) a new version of SATPLAN (called SATPLANO4S) with some improvementis. But in 
2006, the SATPLANO6 (KAUTZ; SELMAN; HOFFMANN 2006) was implemented with mutex 
propagation on the planning graph and encoding with boolean variables for actions and 
fluents. This allowed harder instances to be solved and avoid some memory problems. 


2.3 Planning as Satisfiability 


A STRIPS planning problem is a triple P=(/,G,A), where is the set of facts true in the 
initial state, G is the set of facts true in the goal state, and A a set of allowed actions. Each 
action a € A has preconditions (pre(a)), added effects (add(a)) and deleted effects (del(a)). 

In SAT, propositions are time-stamped to represent actions and facts in different 
situations. Let a € A be an action, so al?) is a decision if the action a is taken or not at time 
t. The same notion is applied to facts, eg, f(1). 

According to Sideris and Dimopoulos (2010), the direct translation of GRAPHPLAN 
into propositional logic is made using some subset of the following clauses: 


1. Unit clauses for initial and goal state; 

2. a (t) —f(?), for every action a and fact f e pre (a); 

3. a (t) —>f(t+1), for every action a and fact ; f e add (a); 
4. a (t) >f(tH1), for every action a and fact f e del (a); 


5. FH(d>a(t)v...v a (t1), for every fact f e add (a) and all actions a, 1 sis m 
(including the noops); 


6. Ff () >a(ti)v..va (t1) vaf (t-1), for every fact f e del (a) and all actions a, 1 


<i<m; 


74. a () v = ad, for every pair of action a,, a,, such that the set della) N pre(a,) 
is non-empty; 


7.2. na (1) v = a(f), for every pair of action a, a,, such that the set della) N add(a,) 
is non-empty; 


7.3. na (1) v = a (t), if there is a pair of facts f e pre(a,), f, e pre(a,), such that f,, f, 
are mutually exclusive at time t; 


8. af,() v FX), for every pair of facts f,, f, that are mutex at time t. 
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BLACKBOX support different encodings of planning problem, for example: 
. BB-7: Clauses 1,2,5, 7.1, 7.2, 7.3 
*  BB-31: Clauses 1,2,3,4,5,7.1,8 
. BB-32: Clauses 1,2,3,4,5,7.1,7.2,7.3,8 
SATPLANOO6 also supports different encodings, such as: 
*- | SATPLANO6-3: Clauses 1, 2,5, 7.1, 7.2,7.3,8 
* | SATPLANO6-4: Clauses 1,2,95,7.1,7.2,8 


Each encoding has different characteristics and must be chosen carefully to be 
translated to MHF. 


2.4 Mixed-Horn Formulas 


Mixed-Horn Formulas (MHF) are formulas composed of a 2-CNF part (clauses 
containing only two literals) and a Horn part (clauses with at most one positive literal). In 
our case, the 2-CNF part is composed only of positive literals, called positive monotone 
2-CNF. The research in MHF is not new, and many problems can be formulated in terms of 
MHF, like the level-planarity test (Randerath et al. 2001) and graph colorability. Now we are 
introducing planning as a problem that can be represented directly as MHFs. 

It is well known that 2-CNF satisfiability and Horn satisfiability are solvable in linear 
time (ASPVALL; PLASS; TARJAN, 1979) (MINOUX, 1988), but SAT for MHF (MHF-SAT) 
is NP-Complete as showed by Porschen and Speckenmeyer (2007). In (PORSCHEN; 
SPECKENMEYER, 2005) (PORSCHEN; SPECKENMEYER, 2007), it was studied 
satisfiability of Mixed-Horn Formulas, proving that the worst case is 0(2º28*"), where n is 
the number of variables in the instance. 


Algorithm: MHFSAT 
Require: M: MHF Formula 
Ensure: 7: Model found 


1 Compute FP := PÍM) 

2 IF F=Ô THEN 

3 RETURN T+ Hornsat (M) 
q END IF 

5 Compute Graph 6, 

6 t- nil;p X e nil; 

7 REPEAT 

8 Compute by MinVC E, | the next minimal vertex cover X of ly, 
E] IF X*W nil THEN 

10 Te Hornsat (M[X]]) 
11 END IF 


12 UNTIL 7 &*nil OR XK=nil 
13 RETURN X UT 


ALGORITHM 1: MFH-SAT Algorithm using minimal vertex cover. 


Porschen and Speckenmeyer also showed there is a polynomial-time transformation 
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of an unrestricted CNF to MHF. In our case, this transformation is not necessary, because 
each horizon of planning problem can be generated directly as MHF, with only one simple 
flip of some literals and it will be explained in the next section. 

Algorithm 1 defined by Porschen and Speckenmeyer (2007) solves MHF-SAT 
using minimal vertex cover. The function P(M) returns all positive monotone 2-clauses in 
M, MinVC(G) generate all minimal vertex covers of a graph G with polynomial delay. The 
function HornSat(H) returns a minimal model t of Hif, and only if, His a satisfiable Horn 


formula, else returns nil. 


31 PROPOSED TRANSLATION 


This paper proposes a Mixed-Horn formulation to the formulas generated by 
SATPLANO6 and BLACKBOX hoping we may gain some improvements in solving time with 
current state-of-the-art SAT solvers. Itis important to note that the transformation is cheap 
to implement, leading to no extra overheads to the planner, as shown below. 

Analyzing the axioms used to generate SAT instances from the planning graph, we 
can generate Mixed-Horn Formulas from, eg, configuration BB-7. In this set of clauses, 
Clauses 1 are unit, clauses 2, 7.1, 7.2, and 7.3 are 2-CNF, and clause 5 can be Horn if we 
invert interpretation of action taken. If an action ais taken, we representitas = aandif is 
not taken we can representit as a. 

The set of axioms (1,2, 5, 7.1, 7.2 and 7.3), representing actions as described above 
and converted to clauses, will be: 


1. Unit clauses for initial and goal state; 
2. a(t) v f(?), for every action a and fact f e pre(a); 


S.af(bvaalt-1)v..vaa (t-1), for every fact f e add (a) and all actions 
a, 1 <i<m (including thenoops); 


74. a ()va,(?), for every pair of action a, a,, such that the set del(a,) N pre(a,) is 
non-empty; 


7.2.a ()va,(?), for every pair of action a, a,, such that the set del(a,) N add(a,) is 
non-empty; 

7.3.a ()va,(i, ifthere is a pair of facts f, e pre(a,), f, e pre (a,), such that f,, f, 
are mutually exclusive at time t; 

Thus, clauses 1 are unit, clauses 2, 7.1, 7.2, and 7.3 are positive monotone 2-CNF, 
and clauses 5 are Horn. This set of clauses is MHF (2-CNF and Horn) and can be solved or 
with general SAT solvers or specific MHF solvers. 

To modify SATPLANOO, we used configuration 4 (clauses 1, 2, 5, 7.1, 7.2, and 8). 
The clauses converted are the same as BLACKBOX, except for the exclusion of clause 
7.3 and inclusion of clause 8, which is negated 2-CNF (or negated Horn, depending on 
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interpretation). Clause 8 just have facts, so its generation to MHF is the same: 


8. 2f,() v ft), for every pair of facts f,, f, that are mutex at time . 


The translation proposed to change some literals (all action literals) by its negations. 
This change makes the formula generated by SATPLANOG6 be in MHF format. This formula 
is equi-satisfiable to the original formula and, when applied to a SAT Solver, has the same 
behavior, but the valuation of action literals must be negated in the subjacent planning 
problem. 

Theorem 1. Be q a theory in CNF. For all literal a. in p, changing a by va. gives a 
theory p' which is equi-satisfiable to q. 

Proof. p and q'are equi-satisfiable if Pp is satisfiable if, and only if, q'is satisfiable. 
If Pis SAT, then q'is SAT too. Let Vbe a valuation in q. fais true (false) in V, so, by the 
transformation made, the same valuation with a as false (true) will be a model of q" If q' 
is SAT, then p is SAT too. Let V'be a valuation in q" If a is true (false) in V; so, by the 
transformation made, the same valuation with a as false (true) will be a model of q. 

Q.E.D. 

As showed by Bylander (1994), planning is PSPACE-Complete. As in CNF, SAT in 
MHF is NP-Complete and despite the use of MHF representation (where SAT theoretically 
has better complexity function), solving planning with satisfiability in MHF formulas remains 
in the PSPACE-Complete class of complexity. 


41 EXPERIMENTS 


For evaluation of the efficiency of MHF compared to standard CNF encoding we 
used SATPLANO6 as our planner and used several domains of classical planning (STRIPS) 
from the ICAPS competition of various years. Our experiments were executed on an Intel 
Xeon 2.1GHz with 256GB of memory. 

Each problem was executed with SATPLANO6 times for every combination. For all 
executions SATPLANOO was set to run with LINGELING and GLUCOSE SAT solvers, for 
both encodings: default CNF and MHF. Each formula generated by SATPLANO6 was given 
a time limit of 3600 seconds to solve and the global time limit (including time spent solving 
formulas and the planner generating them) was set to 4000 seconds. All execution uses 
SATPLANOO with configuration 4, explained in section 2.3. 

Tables 1 to 14 show the average time in seconds of 10 executions of each problem. 
All tables are divided into two different results, one with CNF encoding and the other with 
MHF encoding, in both approaches it is shown average time of SATPLANO6 with LINGELING 
and GLUCOSE SAT solvers. Inside table, TO means timeout were reached, MEM means 


memory limit exceeded. 
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57.688 | 12.945 | 56.925 


28.897 |10.101 | 35.936 
228.196 | 35.283 | 227.794 
TO 306.438 | TO 
TABLE 1: Domain: Storage. TABLE 2: Domain: Satellite 


NF or que 
679 662 679 .648 .658 


678 695 667 

1.149 1.171 1.128 1.161 1.024 1.549 1.432 

1.233 1.211 1.216 1.197 3.325 3.200 2.432 

4.370 4.088 4.323 4.065 10.639 9.554 4.696 

24.375 | 29.546 | 24.321 29.373 36.527 50.317 16.509 
239.897 462.487 | 90.275 


106.738 | 161.330 | 106.054 | 160.248 
333.911 | 494.478 | 330.293 | 491.316 2894.689 | 1236.842 | 3127.132 | 2104.082 


TABLE 3: Domain: Blocks. TABLE 4: Domain: Gripper 


qe que 


6.747 6.162 6.816 6.137 2.148 2.116 1.777 
6.728 6.143 6.799 6.103 5.477 5.418 4.094 
58.443 | 82.510 | 57.055 81./27 9.429 9.400 6.903 
532.297 | 494.540 | 525.645 485.740 150.633 134.581 | 44.842 
877.930 | 820.832 | 1003.5604 | 813.832 1398.500 | 1691.914 | 543.222 | 535.163 











TABLE 5: Domain: Depois. TABLE 6: Domain: Logistic. 


Do o me] [7 e | me 


n 

3.901 2.820 4.130 3.529 4.375 3.544 
2 25.189 8.343 8.101 4.424 7.690 4.384 
3 23.541 10.114 6.967 4.444 8.822 4.428 
4 
5) 
6 


50.025 23.838 30.288 10.541 30.886 9.653 
98.968 19.924 151.592 39.544 158.124 36.591 





1569.0460 | 972.555 | 1655.302 | 978.371 177.997 | 949.610 | 1125.387 | 1122.207 


TABLE 7: Domain: Drivelog. TABLE 8: Domain: Elevator. 
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27.510 
35.319 
76.043 
394.910 


54.953 
174.593 
1363.944 


288.036 
163.359 
348.846 
481.796 


384.086 
86.735 
397.876 
452.125 


382.130 
94.122 


284.710 
154.948 
369./55 | 405.247 
517.795 | 457.101 


TABLE 12: Domain: PipesWorld. 


A 


29.692 
15.917 
486.056 


36.313 
9.609 
421.980 
2151.280 


35.109 
9.844 
402.043 
2295.060 





DN 


o oO No A sr ÇÇGoOÃINoÕãamha 


Õ 


13.692 
13.691 
18.711 
25.335 
35.091 
35.483 
52.280 
51.976 
75.915 
76.071 
100.243 
100.081 
144.287 
202.641 
203.591 


252.118 

345.853 

464.029 
MEM 
MEM 


16.172 
16.179 
29.480 
46.123 
78.851 
78.812 
46.895 
42.452 
61.091 
61.350 
80.0/4 
80.418 
117.127 
160.025 
159.455 
201.425 
281.009 
350.808 
MEM 
MEM 


13.566 
13.495 
18.434 
24.981 
35.001 
34.910 
51.055 
50.810 
74.840 
74.034 
98.256 
98.094 
142.867 
193.888 
192.476 
251.550 
345.302 
457.279 
MEM 
MEM 


15.994 
15.991 
29.238 
45.756 
78.947 
78.360 
41.637 
41.675 
60.234 
60.196 
79.517 
79.988 
114.805 
168.339 
156.243 
194.885 
263.331 
348.500 
MEM 
MEM 
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9 Nino noa a 4a 4a a a a qa 
ONO SOON O GA ÊE GONNA O 


1.097 
734 
1.239 
671 
2.334 
16.898 
1.719 
31.470 
5.740 
TO 
10.002 
12.688 
TO 
8.779 
45.830 


1.065 1.127 
732 703 
1.198 1.209 
.685 742 
1.758 2.099 
4.362 16.734 
1.486 1.714 
4.730 34.578 
4.402 5.758 

21.418 TO 
11.325 10.013 
3.357 13.184 
162.792 TO 
7.134 8.615 
26.160 38.673 
59.306 TO 
182.810 TO 
88.624 TO 
TO TO 
TO TO 
TO TO 
TO TO 
TO TO 
Capítulo 1 


1.084 
147 
1.232 
705 
1.804 
4.507 
1.509 
4.782 
4.445 
20.151 
11.356 
3.417 
175.692 
7.109 
26.424 
53.972 
169.837 
88.513 
TO 
TO 
TO 
TO 
TO 


24 TO TO TO TO 
25 | 939.990 | 808.109 | 938.461 787.037 
26 TO 1199.304 TO 1181.282 





TABLE 13: Domain: Childsnack. TABLE 14: Domain: Rovers. 


With these results, we can conclude that solving classical planning problems using 
SAT with MHF formulas is feasible. As we can see, the results using MHF are close to 
the results using traditional CNF. State-of-the-art SAT solvers are generic solvers for 
the Satisfiability problem and might not always take advantage of the specific structural 
information rooted in the formula, therefore a specific SAT solver to solve MHF is needed 
to enhance solving time, small changes to the branching heuristics and learning structures 
might improve the performance. 

Despite the closer times, some problems are solved faster in MHF. In the Logistics 
domain, table 6, problem 5 takes 1398.5s to solve with LINGELING in CNF while it takes 
543.222s in MHF. The main reason is the last formula (the SAT formula to be solved) that 
takes 777s to be solved in CNF and is just 67s in MHF. Other domains have this behavior 
too, but we are still studying this phenomenon. 

Analyzing all executions, we need to know if there is a statistical difference between 
the K = 4 configurations and N = 93 databases (taking only bases with execution was 
successful in all configurations). Friedman test (DEMSAR, 2006) is used to make paired 
data analysis using performance positions (rank) of all executions. For all N databases, 
each execution is ranked and an average for each K configuration is calculated. 

Although the Friedman test uses a Xº distribution, (DEMSAR, 2006) recommends a 
less conservative version proposed by Iman and Davenport (1980), which uses F distribution 
with (K-1) and (K-1) (N-1) degrees of freedom. 

Evidencing the statistic difference, we applied the Nemenyi post-hoc to show it 
(NEMENYI, 1963). According to it, the effectiveness of the two methods is significantly 
different if their ranks differ at least for a critical difference value, using a level of significance. 


Table 15 shows the average ranking made using all executions. 


o LING GLUC LING GLUC 
3,21505376344086 | 2,12903225806452 | 2,91397849462366 | 1,74193548387097 


TABLE 15: Average ranking Average of execution ranking of formulas. To generate valuable resulis, 
we used only formulas solved by both solvers in both encodings. For each database, all executions are 
ranked (1-4) from best time execution to worst. Then, for each encoding, the average of all rankings is 

calculated. 





Applying Friedman test with K = 4 configurations, N=93 databases, and significance 


Engenharias elétrica e de computação: O terceiro pilar Capítulo 1 RR 


level at 5%, Friedman statistic results F = 35.59910199 and p-value=1.76238E - 19, pointing 
to statistical difference. 

To evidence this difference, we applied the Nemenyi post-hoc at critical difference 
CD=0.4863707283, Q,os = 2.969032078. Figure 1 shows the resulting difference diagram. 
In this diagram, the x-axis represents the average rank for each configuration. Lines below 
the x-axis connect configurations without a statistical difference at 95% of confidence level. 
Critical difference (CD) is showed above the x-axis. 

From this diagram, we can see there is no statistical difference because of problem 


encoding, but the solver used. 


CD 
o 


1 2 3 4 


GLUC-MHF LING-CNF 
GLUC-CNF LING-MHF 


FIGURE 1: Difference graphic for Nemenyi post-test. 


5 | CONCLUSION 


This paper presented a new way to encode Planning as SAT using Mixed-Horn 
Formulas. It is important to focus on ways to represent problems as techniques and SAT 
solver improvemenis are not the only factor to reduce solving time, as discussed by Hooker 
(2007). 

Analyzing formulas generated by planners that use satisfiability as an engine, we 
note that clauses are close to MHF. With an equi-satisfiable modification, we can generate 
MHF instead of CNF and this new encoding is now an option for solvers. 

MHFs have received much attention recently (KOTTLER; KAUFMANN; SINZ, 2008) 
(PORSCHEN; SCHMIDT; SPECKENMEYER, 2009). Many NP-complete problems were 
proved to have encoding to MHF (PORSCHEN; SCHMIDT; SPECKENMEYER, 2009). In 
this paper, we show classical planning also can be solved using MHF and have a promising 
area of study. 

In (PORSCHEN; SPECKENMEYER, 2005) and (PORSCHEN; SPECKENMEYER, 
2007), they showed that the worst-case satisfiability of an MHF is 0(2º284) and despite this 
complexity, it is still NP-complete. They showed too that any SAT instance can be encoded 
in MHF in polynomial time. In our encoding, the same process that generates CNF is used 
to generate MHF, without any overhead. 

In this paper, we show that MHF can be used successfully to encode a planning 
problem, modified SATPLANO6 to generate MHFs instead of normal CNF, and executed 
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many experiments using the same domains applied in IPC. The results show no significant 
improvements over the traditional CNF encoding, but an implementation of a new SAT 
solver based on MHF structure can improve our experiments. 

We show there is no statistical difference between encodings used, despite some 
better executions when MHF is applied. This can occur because the solvers used in MHF 
encoding are not optimized to take advantage of the MHF structure. 

As future work, specific SAT solvers for MHF must be used to compare executions. 
Even a new implementation using specific MHFs for planning can be studied. Besides, as 
described by Porschen and Speckenmeyer (2007), we can study the effect of reducing the 
number of essential variables, and if it is applied to our domain (classical planning). 

For now, we are studying the phenomena described in problem Logistics-5, trying to 
identify domains with this behavior and solving UNSAT formulas faster in MHF. 
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RESUMO: Previsão numérica do tempo (PNT) 
usa modelos atmosféricos de circulação geral 
(MACG) para prever condições futuras da 
atmosfera. O processo de PNT é realizado 
inserindo dados de observação ao modelo 
computacional para calcular as condições iniciais 
- também chamado de análise. Tal procedimento 
é chamado de assimilação de dados (AD). Várias 
técnicas tem sido desenvolvidas para AD. Filtro 
de Kalman por conjunto (ensemble), métodos 
variacionais e filtro de partículas são exemplos de 
técnicas de AD usadas em centros operacionais 
de PNT. Entretanto, tais metodologias requerem 
grande esforço computacional. Aqui, um conjunto 
de redes neurais artificiais (RNA) - perceptron 
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de multicamadas com aprendizado por retro- 
propagação - é configurado para emular o 
Local Ensemble Transform Kalman Filter 
(LETKF) aplicado ao modelo global 3D SPEEDY 
(Simplified Parameterizations PrimitivE-Equation 
DYnamics). A novidade é calcular a análise por 
RNA quando algumas observações não estão 
disponíveis em algum ciclo de AD ou em vários 
ciclos. Uma comparação entre as análises 
produzidas por LETKF e RNA é realizada. 
PALAVRAS-CHAVE: Assimilação de dados, 
modelo atmosférico, rede neural artificial, filtro de 
Kalman por conjunto. 


DATA ASSIMILATION USING ARTIFICIAL 
NEURAL NETWORKS: MISSING 
OBSERVATION 


ABSTRACT: Numerical weather prediction (NWP) 
uses atmospheric general circulation models 
(AGCMSs) to predict the weather future conditions. 
The process is done inserting observation data 
into computer model to compute initial conditions 
— also named “analysis”. Such feature is called 
data assimilation (DA). Several techniques have 
been developed for DA. Ensemble Kalman filter, 
particle filter, variational scheme, are examples 
of DA methods used in the operational NWP 
centers. However, such methodologies require a 
high computational effort. Here, a set of artificial 
neural networks (ANNs) - multi-layer perceptron 
with back propagation learning ( is configured to 
emulate the Local Ensemble Transform Kalman 
Filter (LETKF) applied to the SPEEDY model. 
The novelty is to perform the analysis by ANN 
when some observations are missing in a DA 
cycle, or several cycles. A comparison between 
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analysis produced by the LETKF and ANN is carried out. The numerical experiment was done 
at January 1985. 

KEYWORDS: Data assimilation, atmospheric model, artificial neural network, ensemble 
Kalman filter. 


11 INTRODUÇÃO 


O procedimento para determinar a condição inicial em centros operacionais de 
previsão é chamado de assimilação de dados (AD), onde os campos da previsão prévia 
(background) são combinados com observações para produzir a análise - a nova condição 
inicial. Há muitos esquemas diferentes de AD. Uma revisão dos métodos mais comuns de 
AD pode ser encontrada na literatura, em particular nos livros de Daley [7] e Kalnay [16]. 

Dois esquemas de DA são avaliados aqui: Local Ensemble Transform Kalman filter 
(LETKF) [14] e a abordagem baseada em redes neurais artificiais (RNA) para emular o 
LETKF [4, 5, 11, 19]. A principal vantagem do uso de RNA é diminuir o esforço computacional. 

Experimentos numéricos são realizados usando observações sintéticas de estações 
meteorológicas de superfície (dados a cada 6 horas/dia) e sondagem da alta atmosfera 
(dados a cada 12 horas/dia). A pesquisa investiga o comportamento da técnicas de AD 
com ausência de observações nos ciclos de AD. Cada dia uma sequência de análises para 
assimilações a cada 4 horas: 00:00, 06:00, 12:00, e 18:00 UTC. A malha de observações 
reproduz as estações da Organização Meteorológica Mundial (OMM)'! e das sondagens por 
radiossondas. 

O modelo atmosférico SPEEDY (Simplified Parameterizations PrimitivE Equation 
Dynamics) [2] simula a dinâmica tri-dimensional (3D) da atmosfera - na verdade, o domínio 
espacial considerado é até o nível mais alto da troposfera - com parametrizações física 
simplificadas. São executados 44 ciclos de AD (análise - execução do SPPED ( previsão) 
com as técnica de LETKF e RNA, onde alguns ciclos de AD tem ausência parcial de 


observações. 


21 ASSIMILAÇÃO DE DADOS 


Considerando um sistema não linear com um vetor de estado n-dimensional x* e um 


vetor m-dimencional de observações yº evoluindo de acordo com: 
5 = (xi, tk) + Ok (1) 


ye = h(xf, tr) + vx (2) 


onde gk e vk são termos de ruídos gaussianos, Í(.) e h(.) são equações matemáticas 


para previsão e observação, respectivamente. Previsão é passo para identificar o estado 


1 WMO: World Meteorological Organization. 
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x, de um sistema a partir do último estado por um modelo numérico de previsão de 
tempo. Do ponto de vista matemático, o processo de assimilação pode ser representado 
por: 


x 


ei + w [ye = H(xi,1)), (3) 


W=(HP!HT +R). (4) 


A equação (3) é o passo de análise, onde H é o operador de observação, W é a 
matriz de peso, calculado das matrizes de erros de covariância p' e R, representando erros 
do modelo e de observações, respectivamente. A abordagem de assimilação de dados com 
RNA implementa a função: 


xº = Fyn(yº; x") (5) 


onde F,, é O processo de assimilação de dados, yº representa as observações, x 
é a previsão do modelo, frequentemente chamada de primeira estimativa (first guess) e xº 


é a análise. 
2.1 Local ensemble transform kalman filter - LETKF 


O filtro de Kalman por conjunto (EnKF: Ensemble Kalman filter ) é uma abordagem 
bayesiana proposta por Evensen [8]. Vários esquemas de EnkKF foram desenvolvidos e o 
LETKF (local ensemble transform Kalman filter ) é um destes esquemas [14]. 

Aideia básicado LETKF é realizar a análise para cada ponto de grade simultaneamente 
usando as variáveis de estado e todas as observações na região centrada para um dado 
ponto. A estratégia local separa grupos de observações vizinhas ao redor do ponto de 
grade do modelo. Cada ponto de grade tem um subdomínio local; o número de vetores 
locais é o mesmo número de pontos de grade globais [17]. 


31 REDES NEURAIS ARTIFICIAIS (RNAS) 


Uma RNA é composta de unidades simples de processamento (neurônios) 
para calcular certas funções matemáticas e consiste de neurônios artificiais - ou nós - 
interconectados. Cada neurônio artificial tem uma ou mais entradas e saídas. As conexões 
entre os neurônios armazena uma soma ponderada, chamados de pesos sinápticos. Em 
processamento de RNA, as entradas são multiplicadas pelos pesos alimentando uma 
função de ativação. 

Esta função ativa ou inibe o próximo neurônio. Matematicamente, pode-se 

descrever o i-ésimo neurônio da seguinte forma: 

Soma da entrada: U; = Lai WijXj + b; 
Saída neurônio y; = qp(u;) (6) 

onde X,; X,; ...; X, são as entradas; w,;...; Wi são os pesos sinápticos; c é o viés, 
u, é a saída da combinação linear; p(.) é a função de ativação e y é a i-ésima saída do 
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neurônio e p é o número de entradas do i-ésimo neurônio. 

A rede de alimentação progressiva (feed-forward), que processa na direção da 
entrada para saída, tem uma estrutura de camadas. A primeira camada de uma RNA é 
chamada de camada de entrada, as camadas intermediárias são cnamadas de camadas 
escondidas e a última camada é chamada de camada de saída. Alguns parâmetros, como o 
número de camadas e a quantidade de neurônio em cada camada, definem a topologia da 
rede neural, mas outros parâmetros são também necessários de serem identificados, tais 
como a taxas de aprendizado e de momentum. Os parâmetros da RNA são determinados 
pela natureza do problema. 

Há duas fases distintas no uso de redes neurais supervisionadas: a fase de 
treinamento (processo de aprendizado) e a fase de execução (ativação ou generalização). 
A fase de treinamento das RNAS consiste de um processo iterativo de ajuste dos pesos de 
conexão para o melhor desempenho da rede, estabelecido pelo mapeamento dos pares de 
entrada e saída. O algoritmo de aprendizado é o conjunto de procedimentos para o ajuste 
dos pesos. Cada passo da interação é denominado época”. O processo de treinamento 
iterativo continua até ser atingido um critério de parada, que pode ser um erro mínimo 
estabelecido ou um número máximo de épocas. Uma vez treinada, os pesos de uma RNA 
supervisionada são fixos e a rede estará pronta para receber novas entradas (que não 
pertencem ao conjunto de treinamento) para o cálculo de saídas correspondentes. 

O perceptron de múltiplas camadas (PMC) com o algoritmo de aprendizado retro- 
propagação de erros é a RNA usada em nosso estudo, com ao menos uma camada 
intermediaria [12]. 


41 MODELO SPEEDY 


O modelo SPEEDY [18] é um simulador de circulação atmosférico global (SCAG) 
desenvolvido pelo Centro Internacional de Física Teórica (ICTP: International Centre for 
Theoretical Physics) em Triesty, Itália, com núcleo dinâmico espectral com um conjunto 
simplificado de parametrizações físicas. As variáveis dinâmicas para as equações primitivas 
são integradas pelo método numérico espectral na horizontal para cada nível vertical - mais 
detalhes em [2]. 

O modelo SPEEDY T30L7 é executado com truncamento de 30 termos da expansão 
espectral e (T30) com 7 níveis na vertical (L7): 100, 200, 300, 500, 700, 850 e 925 hPa. As 
coordenadas verticais são definidas no sistema sigma: (o = p/ps), onde ps é a pressão da 
superfície. As coordenadas horizontais são latitude e longitude sobre uma grade gaussiana, 
com espaçamento regular com 96 pontos zonais (longitude) e 48 pontos meridionais 
(latitude). As variáveis prognósticas são a temperatura absoluta (7), pressão de superfície 
(ps), componentes zonal e meridional do vento (u; v) e a umidade específica (9). 
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51 PMC-AD: ASSIMILAÇÃO DE DADOS COM AUSÊNCIA DE OBSERVAÇÕES 


A configuração da RNA para este experimento é um conjunto de perceptrons de 
multicamadas, referenciados como PMC-DA, definido no experimento descrito por Cintra e 
Campos Velho [6]. A topologia da RNA tem as seguintes características: 


1. Dois nós de entrada, um nó para o vetor de observação meteorológica e outro nó 
para o vetor de previsão de 6-hours do modelo SPEEDY; 


2. Um nó de saída para o resultados do vetor de análise; 
3. Uma camada escondida com onze neurônios; 

4. Função tangente hiperbólica como função de ativação; 
5. Taxa de aprendizado h é definida para cada RNA-PMC; 


6. Fase de treinamento para quando o erro atinge 10º ou após 5000 épocas - com o 
critério que ocorre primeiro. 

Os vectores de entrada representam o ponto de grade para um a simples variável 
com o corresponde par observação - previsão. No algoritmo de treinamento, PMC-DA 
calcula a saída e a compara com o vetor de análise do LETKF - o dado alvo. Os vetores de 
saída representam os valores de análise para o ponto de grande. 

O esquema PMC-AD foi desenvolvido com um conjunto de trinta RNAs: o planeta 
Terra é dividido em 6 regiões com cinco variáveis prognósticas (ps; u; v; T; q). Deste modo, 
cada região e para cada variável tem-se uma RNA específica para assimilação de dados. 
Todas as RNAs tem uma camada escondida com o mesmo número de neurônios para 
todas as regiões, mas com diferentes pesos de conexão. O esquema de PMC-DA divide 
o globo inteiro em seis regiões: para o hemisfério Norte, 90º N e três regiões longitudinais 
de 120º cada; para o hemisfério Sul, 90º S e três regiões longitudinais de 120º cada. todas 
as regiões tem o mesmo tamanha, mas o número de observações é distinto para cada 
região - ver Figura 1. Esta divisão em regiões é aplicada somente para PMC-AD e não para 
o procedimento com LETKF. 
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Figura 1: Localizações de observações na área global. Os pontos na figura representam estações de 
coleta de dados de radiossonda (—- 415). 


O esquema PMC-AD é projetado para emular a análise do LETKF do cálculo da 
condição inicial para o modelo SPEEDY. a análise do LETKF é o campo médio das análises 
do conjunto (ensemble). 

As matrizes de covariâncias para os níveis superiores e de superfície para executar 
o sistema LETKF, bem como as condições de contorno, são as mesmas usadas nos 
experimentos de Miyoshi [17] e Cintra [6]. A assim chamada “verdade” (ou controle) do 
modelo é gerada pela simulação do modelo SPEEDY sem ruído nos dados. Os ciclos 
de assimilação são considerados em 4 períodos em cada dia (00:00, 06:00, 12:00, 
18:00 UTC). As observações sintéticas são geradas lendo o campo “verdade” do modelo 
SPEEDY e adicionando um ruído aleatório sobre as variáveis meteorológicas. A localização 
das observações estão sobre os pontos de grade do modelo SPEEDY. Uma máscara de 
observação é projetada, adicionando uma marca positiva para o ponto de grade onde 
a observação deveria ser considerada. As localizações são similares às estações e de 
observações de radiossondas da WMO - ver Figura 1. Exceto para observações de ps, as 
outras observações são também descritas para os sete níveis superiores. 

O esquema de assimilação de dados PMC-AD não tem matrizes de erro de 
covariância para distribuir a influência dos dados de observação. Consequentemente, 
é necessário calcular a influência das observações no entorno do ponto de grade. Este 
cálculo é baseado na distância do ponto de grade relacionado às observações no interior 


de um determinado raio de influência (inicialmente: y = 0) 
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onde yº é a observação ponderada, M é o número de camadas discretas consideradas 
no entorno do ponto de grade, FÊ = (Xp- yZ)? + Lp — y;)? + (zp—Yk)”, onde 
(xp; Yp; Zp) é a coordenada do ponto de grade e (Vi, Yi. Vk) é a coordenada da observação, 
y, é um contador de pontos de grade das observações no entorno de (Yi, Yi. Yk). Se Y. 6, 
não há influência a ser considerada. Daqui para frente, os valores computados de Eq. (7) 
são referenciados como pseudo-observação. 

O processo de treinamento foi feito como no experimento realizado por Cintra 
e Campos Velho [6]. Com as redes treinadas, o sistema está pronto para ser usado no 
processo de assimilação de dados. A ativação da PMC-AD tem valores de entrada (previsão 
e observação) para cada ponto de grade. Os experimentos de assimilação de dados com 
PMC-AD é realizado para 11 dias (44 ciclos). A data de início foi 10 de janeiro de 1985 
OOUTC até 20 de janeiro de 1985 18UTC. 

Os ciclos de AD iniciam com uma máscara global completa das observações, para 
as cinco variáveis prognósticas, com quatro variáveis para o ar superior para os sete 
níveis verticais. Durante três dias (12 ciclos), as análises para o modelo SPEEDY foram 
calculadas de 415 estações para todas as variáveis (12035 observações) - Fase-1. Nos 
próximos dois dias (12/Jan e 13/Jan) com oito ciclos, não há observações para U, Ve Q, 
novamente com 415 estações com temperatura e pressão de superfície somente (3320 
observações) - Fase-2. Para os próximos cinco dias (20 ciclos), não há observações do 


conjunto de Estações - Fase-3. 


6 | RESULTADOS E CONCLUSÃO 


Os valores de entrada e saída das variáveis prognósticas (ps, u, v T, q) são 
processados sobre os pontos de grade do modelo para integração no tempo. Levando em 
conta as pseudo-observações (Eq. 7), com dois espaçamentos de grade (M = 2) como raio 
de influencia no entorno do ponto de grade, como considerado por Cintra e Campos Velho 
[4]. Os resultados mostram a comparação dos campos de análise gerados pelos esquemas 
PMC-AD e LETKF com os campos verdade. 

As diferenças entre as análises para observação global de umidade (q) para 950 hPa 
é apresentado na Figura 2, considerado o ciclo de assimilação executado em 10 Janeiro 06 
UTC: Fase-1. Figura 3 mostra a umidade com ausência de observações (u; v; q) na Fase-2 
(13/Janeiro as 12 UTC). 
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Figure 2: Umidade (kg/kg) em 10/Janeiro as OGUTC: análises LETKF, PMC-AD e campo Verdade -- e 
diferenças: (LETKF e PMC-DA), (Verdade e LETKF), (Verdade e PMC-AD). 


Para a temperatura absoluta e pressão de superfície no nível de 950 hPa - ver 
Figuras 4 e 5 para resultados na Fase-2 (13/Janeiro as 12 UTC), com ausência de 
observações para (u; v; q), para 415 estações para temperatura (7 camadas verticais) e 
pressão de superfície. Os campos de temperatura estão unidades de graus Kelvin (valores 
acima de 273,15) com diferenças até 10 K em alguns pontos. Para o campo de pressão de 
superfície, Há diferenças em 

todo o domínio, porque há pseudo-observações sobre todo o domínio. 
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Na Fase-3, LETKF e PMC-DA são executados com observações ausentes em 
alguns pontos. Figura 6 mostra a pressão de superfície em 18/Janeiro às OOUTC, último dia 
dos ciclos de observação. Para a Fase-3, a máscara de observação está completa. similar 
a Fase-1. O modelo tem o mesmo comportamento que o experimento prévio de Cintra e 
Campos Velho [6] - ver Figura 7 para análise de temperatura para 19/Janeiro às OOUTC. 


dada Humiaia | 
Letkf analysis state — 1985 Jon 13 12UTc(z1) ANN analysis stote — 1985 Jon 13 12UTC(z1) 














Figure 3: Umidade (kg/kg) em 13/Janeiro as 12UTC: análises LETKF, PMC-AD e campo Verdade -- e 
diferenças: (LETKF e PMC-DA), (Verdade e LETKF), (Verdade e PMC-AD). 


As análises são tentativas de aproximar as variáveis do modelo à realidade. Menor 


quantidade de observações significa uma análise pior. Ausências de observações podem 
ocorrer em diferentes ciclos de assimilação. A técnica de PMC-DA foi treinada com 2 
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espaçamentos de grade como raio de influência para as observações (M = 2 na Eq. (7)). 
Figuras 3, 5 e 7 mostram uma boa concordância entre as análises do LETKF e PMC- 
DA. Figuras 2, 4 e 6 mostram algum desacordo entre as análises obtidas com as duas 
metodologias. Observando a Figura 6, pode-se perceber diferenças significativas sobre a 
região da zona de interface entre Europa-Ásia e principalmente sobre os oceanos. 
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Figure 4: Temperatura absoluta (K) em 13/Janeiro as 12UTC: análises LETKF, PMC-AD e campo 
Verdade -- e diferenças: (LETKF e PMC-AD), (Verdade e LETKF), (Verdade e PMC-AD). 


Há diferenças em vários pontos do domínio - ver Figura 2 (análise via RNA) sobre 
o Alaska e Vladivostok (pontos vermelho) e Figura 4 (Norte da Rússia e sobre o mar ao 
Norte do Canadá e Groenlândia), indicando que o raio de influência da observação não foi 
efetivo o suficiente para calcular de forma adequada a pseudo-observação com M = 2. Uma 
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maneira de superar as diferenças apontadas é aumentar a influência da observação (M=>3). 
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Figure 5: Pressão de superfície (hPa) em 13/Janeiro as 12UTC: análises LETKF, PMC-DA e campo 
Verdade -- e diferenças: (LETKF e PMC-DA), (Verdade e LETKF), (Verdade e PMC-DA). 
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Figure 6: Pressão de superfície em 18/Janeiro as OOUTC: análises LETKF, PMC-DA e campo Verdade 
| e diferenças: (LETKF e PMC-DA), (Verdade e LETKF), (Verdade e PMC-DA). 
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Figure 7: Temperatura absoluta em 19/Janeiro as OOUTC: análises LETKF e PMC-DA -- e diferenças: 
(LETKF e PMC-DA). 
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RESUMO: Criar a classificação de salas de 
ópera é uma tarefa não exata, pois depende de 
diversos fatores subjetivos. Baseado em uma 
Classificação Subjetiva (Hidaka e Beranek, J. 
Acoust. Soc. Am. 107, 340-354 (2000)), criou 
uma Classificação Objetiva utilizando o método 
de tomada de decisão multicritério PROMETHEE 
ll, utilizando como critérios os parâmetros 
acústicos objetivos para 22 salas de ópera 
apresentados em Beranek (Springer Verlag, NY, 
2004), sendo que 13 também foram incluídas no 
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estudo realizado por Hidaka e Beranek (2000). 
Assim, basearam-se em um ranking subjetivo 
simplificado, o qual considerou apenas as 13 
salas que continham dados acústicos disponíveis, 
o que possibilitou a comparação e a validação da 
classificação objetiva proposta. São introduzidos 
os principais conceitos e apresentadas as 
adequações necessárias para que o trabalho 
pudesse ser realizado. Como resultado inicial 
se obteve um ranking objetivo com 4 salas de 
ópera classificadas com posições iguais e 5 
salas com diferença de até duas posições em 
comparação com a classificação realizada por 
Hidaka e Beranek (2000), de um total de 13 
salas analisadas. Posteriormente, aprimorou-se 
tal classificação objetiva utilizando o método de 
otimização Elipsoidal, visando que este chegasse 
o mais próximo possível da classificação 
apresentada em Hidaka e Beranek (2000). 
Nesta etapa foi possível diminuir a discrepância 
entre 4 salas de ópera. Como resultado final, a 
Classificação Objetiva Otimizada foi utilizada 
para criar um ranking contendo todas as 22 salas 
de ópera com parâmetros acústicos disponíveis, 
sendo que 9 destas não foram analisadas no 
estudo realizado por Hidaka e Beranek (2000). 
PALAVRAS-CHAVE: Sala de ópera, 
PROMETHEE ll, elipsoidal, ranking objetivo. 


CONCEPTION AND OPTIMIZATION OF 
OBJECTIVE RANKING FOR OPERA 
ROOMS USING COMPUTATIONAL 
METHODS 
ABSTRACT: Creating the classification of opera 
rooms is notan exacttask, asitdepends onseveral 


Capítulo 3 


subjective factors. Based on a Subjective Classification (Hidaka and Beranek, J. Acoust. Soc. 
Am. 107, 340-354 (2000)), he created an Objective Classification using the PROMETHEE || 
multi-criteria decision-making method, using the parameters as criteria objective acoustics for 
22 opera houses presented in Beranek (Springer Verlag, NY, 2004), 13 of which were also 
included in the study by Hidaka and Beranek (2000). Thus, they were based on a simplified 
subjective ranking, which considered only the 13 rooms that had available acoustic data, 
which enabled the comparison and validation of the proposed objective classification. The 
main concepts are introduced and the necessary adjustments for the work to be carried out 
are presented. As an initial result, an objective ranking was obtained with 4 opera rooms 
classified with equal positions and 5 rooms with a difference of up to two positions compared 
to the classification carried out by Hidaka and Beranek (2000), out of a total of 13 rooms 
analyzed. Subsequently, this objective classification was improved using the Elipsoidal 
optimization method, aiming to get it as close as possible to the classification presented in 
Hidaka and Beranek (2000). At this stage it was possible to reduce the discrepancy between 
4 opera rooms. As a final result, the Optimized Objective Classification was used to create a 
ranking containing all 22 opera rooms with available acoustic parameters, 9 of which were not 
analyzed in the study carried out by Hidaka and Beranek (2000). 

KEYWORDS: Opera room, PROMETHEE ||, ellipsoidal, objective ranking. 


11 INTRODUÇÃO 


Classificar a qualidade sonora de um ambiente é uma tarefa não exata, pois depende 
de diversos parâmetros subjetivos e objetivos, e outro ponto é que análise sonora deste 
ambiente pode obter um resultado bom para uma pessoa, e ruim para outra. Uma tentativa 
de determinar quais características acústicas que admiradores de música erudita preferem 
em uma sala de ópera muitas vezes está intrinsecamente relacionada com a sensação que 
estes tiveram quando frequentaram determinado ambiente, assim uma gama de elementos 
é responsável para criar a satisfação: a composição, o maestro, a orquestra, e a sala de 
ópera devem ter boa qualidade para criar uma audição memorável. Para o profissional 
da área da música, seja ele um maestro, um músico, ou um engenheiro acústico, é vital 
distinguir quais destes fatores contribuem para uma boa qualidade sonora do ambiente 
(Beranek, 2004). 

As propriedades acústicas de uma sala de ópera são fortemente influenciadas 
pelas suas características construtivas, e existem algumas que são importantes, como 
por exemplo: em salas de concerto têm-se a necessidade da existência de superfícies 
reflexivas perto do palco (Beranek, 2004). As diferentes formas de construção de tais 
ambientes alteram diretamente os seus parâmetros acústicos objetivos, os quais são uma 
representação numérica das características perceptivas do som, e sua análise nos dá uma 
boa ideia da qualidade acústica de um ambiente para determinada aplicação, como por 
exemplo: um ambiente projetado para a audição de uma orquestra pode não ser adequado 
para a voz falada ou para a o show de uma banda de rock. 
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Hidaka e Beranek (2000) criaram uma classificação subjetiva para 23 salas de ópera, 
a qual serviu de base e como fonte de dados para a validação do trabalho desenvolvido. 
Em Beranek (2004) é apresentada uma tabela com parâmetros acústicos objetivos para 
23 salas de ópera, sendo que 13 destas também estão incluídas no estudo subjetivo 
apresentado em Hidaka e Beranek (2000). Dessa forma, o objetivo deste trabalho é criar 
uma CO utilizando como critérios tais parâmetros acústicos objetivos e comparar seu 
resultado com o obtido com a CS apresentada em Hidaka e Beranek (2000). 

A CO foi criada considerando diversos parâmetros, como o tempo de reverberação 
(RT) e o BQI, o que a classifica como um problema de tomada de decisão multicritério 
(MCDM). Tais problemas geralmente lidam com a classificação de várias alternativas 
do melhor para o pior, considerando múltiplos critérios (Behzadian et al., 2009). Para 
resolver este problema, implementou-se o método PROMETHEE Il no Matlab. Existem 
várias versões desta família de métodos, e optou-se pelo tipo Il pelo fato deste gerar uma 
classificação completa sem incomparabilidade (Brans e Vincke, 1986). 

São apresentados os resultados da implementação deste método de classificação e 
as dificuldades e particularidades encontradas na tentativa de otimizar esta CO utilizando 
o método Elipsoidal. É apresentado o melhor resultado obtido após vários testes, e por 
último, o procedimento de classificação foi utilizado para criar um ranking com todas as 22 
salas de ópera com dados acústicos disponíveis, contendo 13 salas incluídas em Hidaka 
e Beranek (2000) e mais outras 9 salas que não haviam sido previamente classificadas. 


21 METODOLOGIA 


Esta parte do artigo descreve em seus próximos subitens a metodologia utilizada 
para criar a CO, e posteriormente o procedimento utilizado para otimizá-la. 


2.1 Parâmetros acústicos objetivos 


Beranek (2004) e Hidaka e Beranek (2000) relacionam diversas medidas físicas 
de qualidade acústica. A Figura 1 apresenta os descritores utilizados, assim como o seu 
respectivo nome e o critério que este foi referenciado na implementação do algoritmo de 
classificação utilizado. Os PO para 23 salas de ópera foram obtidos Beranek (2004) p. 558. 
A sala Royal Opera House (LO) não foi considerada, pois não há dado para um parâmetro 


acústico. 
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Símbolo Nome Critério Relacionado 


RF es M Tempo de Reverberação gm 
EO nos M Tempo de Decaimento Inicial go 
Cso.3 Fator de Clareza 93 
Gr 125 Fator de Intensidade para a banda de 125Hz ga 
GM Fator de Intensidade para as médias frequências gs 
BQI Binaural Quality Index 96 
ITDG Tempo de Atraso Inicial 97 


Figura 1. Parâmetros Acústicos Objetivos (detalhados em Beranek (2004) e Hidaka e Beranek (2000)). 


2.2 Classificação subjetiva (CS) 


Hidaka e Beranek (2000) apresentam o procedimento utilizado para comparar e 
classificar 23 salas de ópera. Questionários foram enviados para diversos maestros, e 
lhes foi solicitado para avaliar as características acústicas das SO's que eles conheciam 
bem em escalas de 5 subdivisões, que foram marcadas com números de 1 até 5. Neste 
trabalho foram consideradas apenas as SO's que têm seus parâmetros acústicos objetivos 
disponíveis em Beranek (2004). Assim, a classificação subjetiva considerada contém 13 


salas de ópera, e seu resultado está apresentado na Figura 2. 


Rating Opera House 


l Teatro Colón, Buenos Aires A 
S 


B 
Semperoper, Dresden D 
3 Teatro alla Scalla, Milan MS 


PS 
S 


0 T Staatsoper, Vienna E é: 


Civic Opera, Chicago 
Komischeoper, Berlin 





Figura 2. Classificação Subjetiva de 13 salas de ópera (Hidaka e Beranek, 2000). Obs.: Apenas foram 
consideradas as salas que contêm dados acústicos disponíveis em Beranek (2004). 


A classificação apresentada na Figura 2 foi empregada como a referência para a 
criação e comparação com a CO utilizando o PROMETHEE ||, cujas principais características 


de sua implementação e formulação são apresentadas na seção a seguir. 
2.3 Classificação objetiva utilizando o PROMETHEE II 


Para criar a classificação objetiva utilizou os parâmetros acústicos objetivos 
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apresentados em Beranek (2004). Esta parte do trabalho descreve como o PROMETHEE 
Il foi implementado, e quais foram as considerações para a modelagem e resolução do 
problema proposto. 

Para a implementação do PROMETHEE |l algumas considerações foram adotadas. 
Primeiro, não temos parâmetros acústicos que são ideais, apenas valores recomendados. 
Para O caso em questão, adotou-se que os parâmetros acústicos da sala com a melhor 
classificação (Teatro Cólon em Buenos Aires - BA). Desta forma, realizou-se a classificação 
a partir da segunda SO na CS. 

Assim, o problema multicritério foi modelado de tal maneira que quanto mais os 
parâmetros acústicos de determinada sala se aproximassem dos parâmetros da sala 
considerada como sendo ideal (BA), melhor será sua classificação final. 

Cada um dos 7 critérios apresentados na Figura 1 foram obtidos considerando o 
valor absoluto da diferença entre o valor do PO da sala em questão comparado ao da sala 
(BA). Por exemplo, o valor para o critério do RT... para sala de ópera DS é dado por: 

9,09 = Rem — Rooms = 11.96 — 1.6] = 0.04 

Dessa forma foi possível estabelecer a matriz de critérios como representado na 
Figura 83. 

A seguir são detalhados os passos (Steps) descritos no algoritmo representado na 
Figura 4: 


*— Step? — O cálculo de d 
ae b. Por exemplo: d 


é a diferença entre os valores do critério j para as SO 
—0.28 


(a,b) 

nosms) = Iips” Sims = 

- — Step2- A aplicação da função de preferência foi realizada utilizando um critério 
gaussiano como descrito em Brans e Vincke (1986). E inicialmente utilizou o = 
0.5, logo: 


dita b) 
Pi(a, b) — (0, Se d;(a,b) <0,1- EXP "05" se dita,b) e 


- || Step3- O cálculo de rr(a, b) foi realizado considerando inicialmente um vetor de 
pesos iguala: [w, w,...w]=[1111132] 


- | Step4-—- O parâmetro q*(a) indica que quanto maior for seu valor, mais a sala 
de ópera a domina as outras candidatas, e de forma análoga, quanto menor for 
p-(a), menos a é dominada (Brans e Vincke, 1986). 


- | Step5- Para o caso implementado, quanto menor o valor de (a), significa que 
a SO tem os parâmetros acústicos mais próximos dos ideais. 
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0.3000 — 0.0700 
2.7000  0.1700 


1.7000 — 0.1500 
0.2000 — 0.0100 
0.4000  0.0500 
1.9000 — 0.0300 
1.2000  0.2500 
1.1000 — 0.1900 
1.2000 — 0.2600 
2.1000  0.1200 
-3.6000 — 0.0300 
OFT000 O. 1000 
0.9000 — 0.2000 


pera 2.8000  0.1100 
Eastman Theater, Rochester 1.2000 01100 
Opera House, Seattle 0.3000  0,1700 
Bunka Kaikan, Tokyo 00500 00300 0 0 21000 00900) 


“NT Nissei Theater, Tokyo 0.4600  0.6600 3.3000 0.5000 2.9000 0.0700 
WI] Opera House, Washington 


Figura 3. Matriz de Critérios. 
Step 1. Determination of deviations based on pair-wise comparisons 
d;(a,b) = g;(a)-g,(b) (1) 


Where d p(a,b) denotes the difference between the evaluations of a and b on each criterion. 


Step 2: Application of the preference function 
P(a,b)=F,ld;(a,b)]  j=,...k 


Where P;(a,b) denotes the preference of alternative a with regard to alternative b on cach criterion, as a function of 


d;(a,b) A 


Step 3: Calculation of an overall or global preference index 


k 
VabeA, r(a,b) = DL P(a,b)w, (3) 
j=l 


Where z(a,b) of a over b (from O to 1) is defined as the weighted sum p(a,b) of for each criterion, and W, is the weight 


associated with /th criterion. 


Step 4: Calculation of outranking flows/ The PROMETHEE I partial ranking 


d'(a) e ma >m(a,x) (4) and a da(x,a) (5) 
n 


5 XxcA n—l XcAM 


Where 6 (a) and é (a) denote the positive outranking flow and negative outranking flow for cach alternative, 
respectively. 


Step 5: Calculation of net outranking flow/ The PROMETHEE II complete ranking 
Ha)=4(a)-& (a) (6) 


Where d(a) denotes the net outranking flow for cach alternative. 


Figura 4. Algoritmo utilizado para a implementação do PROMETHEE || (Behzadian et al., 2009). 
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31 RESULTADOS E PROCEDIMENTOS EXPERIMENTAIS 


O algoritmo PROMETHEE Il foi implementado no Mailab, e foi possível perceber 
que existe uma relação entre a CS com a CO criado, assim como ilustrado na Figura 5. 
Nota-se que três salas de ópera obtiveram a mesma classificação que a CS (DS, TT e PS) 
e cinco tiveram uma diferença de uma ou duas posições (VS, SG, HS, BDe CC). 


Comparing SRO with the ORO using PROMETHEE II 
14 


E Subjetive ro 
E Objective PO using PROMETHEEI 





Rating 


BA DS M5 TT PG PS o ív5 NH SG H5 BD CC EK 
Úpera Houses 


Figura 5. Classificação Objetiva criada utilizando o PROMETHEE Il. 


Na tentativa de obter a melhor classificação possível, um problema de otimização foi 
modelado. Como parâmetros de entrada, optou-se pela variação dos pesos (W, LE 12, um 
7), e como função objetivo, optou-se por trabalhar com o somatório das diferenças entre a 
CSeacCo0O, dessa forma obteve-se: 

N 
forjWr Wa mw) =D (Cos — Cool)? 
i=1 

Para avaliar a natureza da função objetivo, os pesos w até w, foram fixados em 1, e 
variou-se os valores de w, e w,no intervalo de O até 1. A Figura 6 mostra este resultado para 
a função objetivo modelada. Devido a presença de quinais na op a aplicação de métodos 
determinísticos que utilizem o gradiente não puderam ser utilizados, e uma possibilidade 
encontrada foi a utilização do método Elipsoidal, o qual utiliza o cálculo do sub-Gradiente 


para achar a direção de busca. 
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Figura 6. Função Objetivo considerando apenas as variações dos parâmetros w, e w.,. 


O algoritmo foi lançado considerando a variação de todos os parâmetros, porém se 
analizarmos a Figura 6 podemos ver a presença de semiplanos, e quando o algoritmo caia 
nestes subespaços o cálculo da derivada numérica (obtida a partir de pequenas variações 
em cada um dos eixos referentes aos critérios) retornava um valor nulo, o que interrompia 
seu processamento. Isto pode ser verificado na Figura 7, quando o algoritmo executou um 


número de 11 iterações. 


Função Objetivo 





Figura 7. Histórico da Função Objetivo pelo número de iterações. 


Engenharias elétrica e de computação: O terceiro pilar Capítulo 3 


Outros fatores importantes que foram observados, foi que cada hora que o algoritmo 
era lançado, encontrava uma solução diferente. Tal ação pode ter sido causada pela 
característica multimodal da função objetivo, porém devido a alta dimensionalidade do 
problema, não foi possível concluir a veracidade desta suposição. Outro ponto, é que foi 
possível verificar que a função objetivo oscila, todavia é possível notar um ganho entre o 
valor inicial da função objetivo e o valor final, e foi isto que motivou o aprofundamento do 
método escolhido. 

Para buscar um resultado melhor, incrementou-se o algoritmo de forma que diversos 
lançamentos sucessivos fossem efetivados, e um histórico do valor final da Am foi sendo 
armazenado, assim como a posição do vetor solução para os pesos. 

O número de lançamentos foi sendo aumentado até que um ganho ocasionado 
por esta alteração não fosse percebido, e um bom número encontrado foi o de 3000 


lançamentos. O resultado de tal análise está representado na figura 8. 


EE] 


25d 


mi 


Função Objetivo 


100 





2000 2500 Er 


1500 
Número do Lançamento 


Figura 8. Histórico do valor final para a 1, considerando um número de lançamentos igual a 3000. 


Para está análise, encontrou-se que o valor mínimo encontrado para a função 
objetivo foi: Ao = 834. 

Analisando a Figura 8 nota-se a presença de 4 lançamentos em que ocorreu este 
valor mínimo para a Loop porém em cada caso encontrou-se um vetor solução, mostrando 
que foram encontrados mais de um ponto de mínimo. 

Desta forma obteve-se a classificação objetiva otimizada (COO), e seu resultado 
assim como uma comparação com as outras classificações estão representadas na 


Figura 9. 
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Comparação entre os Rankings Subjetivo, Objetivo e Objetivo Otimizado 





Opera Houses 


Figura 9. Comparação entre as Classificações Subjetiva (CS), Objetiva (CO) e Objetiva Otimizada 
(COO). 


Outros critérios de implementação foram variados a fim de avaliar o resultado, os 
quais foram: 


* | Variação do intervalo de busca — o intervalo inicialmente fixado entre valores de 
0e5,0e1,0e10e0€e 100, porém esta alteração não modificou os resultados. 


* | Variação do parâmetro o — Este parâmetro, inicialmente fixado em 0.5 foi va- 
riado para valores iguais a 0.01, 0, 1, 0.3, 0.7, 0.9, 0.95 e 0.99, e percebeu que 
isto altera no melhor valor encontrado para a função objetivo, e os valor que 
geraram os melhores resultados foram os de 0.95 e 0.99. E para estes, teve-se 
que: f,,=80e w = [0.1983 0.1038 0.0082 0.1270 1.0000 0.7559 1.0000]. 

O último resultado obtido foi a inserção dos dados das outras 9 SO's que não foram 
incluídas no questionário realizado por Hidaka e Beranek (2000). A classificação das 22 
salas, cujos parâmetros acústicos estão disponíveis em Beranek (2004), está apresentada 
na Figura 10. 
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Z 
cs 


Rating Opera House O 
BA Teatro Colón, Buenos Aires - 
DS Semperoper, Dresden -2.49 
NM Metropolitan Opera, New York  -2.30 
TT New National Theater, Tokyo -2.00 
VS Staatsoper, Vienna -1.99 
BE Erkel Theater, Budapeste -1.08 
PS Staatsoper, Prague -0.92 
EO Opera House, Essen -0.86 
RE Eastman Theater, Rochester -0.26 
TB Bunka Kaikan, Tokyo -0.21 
BS Staatsoper, Budapeste 0.24 
LIZ SG Festspielhaus, Salzburg 0.47 
NT — Nissei Theater, Tokyo 0.55 
14 AM Music Theater, Amsterdam 0.63 
15 BK ' Komischeoper, Berlin 0.71 
16 BD Deutscheoper, Berlin 0.78 
WJ Opera House, Washington 0.79 
18 MS Teatro alla Scalla, Milan 1.06 
SO Opera House, Seattle 1.53 
G Opéra Garnier, Paris 1.70 
21 HS Staatsoper, Hamburg 1.73 
22 00 Civic Opera, Chicago 1.94 


[a 


La 


[A 
o |2/00 


| 12 "SG Festspielhaus, Salzburg | 047 | 


No 
So 
ae, 


[a [a 
o) ——] 





Figura 10. Classificação Objetiva Otimizada para as 22 salas de ópera cujos dados acústicos estão 
disponíveis em Beranek. 


4 | CONCLUSÕES E TRABALHOS FUTUROS 


Verificou-se que a utilização do algoritmo PROMETHEE ll para a classificação objetiva 
de salas de ópera apresentou resultados consideráveis, pois gerou uma classificação com 
4 posições iguais e com 5 salas de ópera apresentando diferença de até duas posições, de 
um total de 13 SO's em questão. 

A utilização de um método de otimização para buscar uma classificação mais próxima 
do ranking subjetivo trouxe melhorias, pois diminuiu a discrepância na classificação de 4 
salas de ópera (MS, PG, NM, e BK). Porém através da utilização do método de otimização 
Elipsoidal, não foi possível garantir que o ranking foi completamente otimizado, e se faz 
necessário o estudo de outros métodos de otimização e outras formas de modelagem da 
função objetivo, os quais ainda estão em estudo. 

A criação de uma classificação incontestável não é possível, devido ao fato desta 
ser uma tentativa de quantificar parâmetros muitas vezes subjetivos, e que seu resultado é 
dependente de opiniões pessoais. 

E mesmo com essas restrições, foi possível validar é aproveitar o principal resultado 
obtido, que foi a criação de uma classificação mediante apenas a avaliação de critérios 
objetivos, a qual é menos trabalhosa e pode ser estendida de forma simples a medida que 


mais salas de ópera entram em análise. 
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RESUMO: Este artigo conta com a descrição de 
ferramentas focadas na gerência de um servidor 
de rede em um ambiente corporativo, visando 
assim um melhor controle de toda a estrutura, 
gerando maior segurança e confiabilidade para 
a empresa. Com o passar dos anos, o ataque as 
redes vêm crescendo cada vez mais, e um bom 
gerenciamento da rede é primordial dentro de um 
ambiente corporativo. O objetivo é demonstrar 
a implementação de ferramentas de redes, 
que se aplicam para um melhor gerenciamento 
em grande parte de ambientes corporativos e 
assim poder demonstrar que o uso de softwares 
livres, podem trazer Ótimos resultados para as 
empresas com um baixo custo. 
PALAVRAS-CHAVE: Servidor, 
serviços. 


segurança, 


ABSTRACT: This article has the description of 
tools focused on the management of a network 
server in a corporate environment, aiming at a 
better control of the entire structure, generating 
greater security and reliability for the company. 
Over the years, attacking networks have been 
growing more and more, and good network 
management is paramount within a corporate 
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environment. The goal is to demonstrate the 
implementation of network tools, which apply 
to better management in large part of corporate 
environments and thus to demonstrate that the 
use of free software, can bring great results for 
companies with a low cost. 

KEYWORDS: Server, security, services. 


11 INTRODUÇÃO 


A informática é apresentada como uma 
ferramenta para auxiliar nos trabalhos diários 
das empresas e garantir a segurança. Além 
disso, é uma ferramenta capaz de prover uma 
conectividade entre as pessoas da própria 
empresa, tanto em um meio interno, quanto 
externo. Com isso, temos a segurança de 
redes para garantir uma melhor segurança 
de todo o ambiente. Para isso se deve traçar 
um planejamento de toda estrutura de rede e 
servidores para se ter uma melhor segurança 
do ambiente e procurar adequar ao máximo 
dentro dos orçamentos dispostos pela empresa. 
Neste planejamento temos como foco todos os 
equipamentos necessários e os softwares para 
ter o melhor aproveitamento do hardware de 
baixo custo garantindo a segurança da empresa 
com a utilização de ferramentas (softwares) 
livres. Em nosso meio, utilizamos como estudo 
de caso uma empresa leiloeira. Problemas na 
estrutura de rede que causavam problemas 
durante a transmissão ao vivo do leilão, 


ocorrendo diversas quedas do sistema. Os 
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serviços de rede sempre instáveis e sem confiança, paravam de funcionar inesperadamente, 
e para quem acompanha o leilão online isso causa quedas na conexão deixando o serviço 
do leilão inativo ou com grandes lentidões. Entretanto, para a empresa leiloeira, a maior 
necessidade é uma transmissão de áudio ao vivo para um melhor aproveitamento do leilão 
e por ter uma alta demanda de compradores (usuários) online. Com estes problemas, 
buscamos a implantação de uma nova estrutura de rede para solucionar estes problemas, 
onde possibilita um total gerenciamento do sistema durante os leilões, trazendo a confiança 
nos serviços hospedados localmente e implantando a transmissão de áudio ao vivo. Como 
a empresa já possui um parque de hardware com bom potencial, foi decidido pela estrutura 
local, pelo melhor gerenciamento e suporte. Com isso foi desenvolvido servidor de internet, 
arquivos e streaming de áudio ao vivo para o novo ambiente, utilizando máquinas virtuais, 
onde os servidores utilizam sistema Linux e para utilização, foi aplicado máquinas com 
ambiente Windows para os testes das funções. Implantamos serviço de Firewall, Squid, 
DHCP, DNS, Icecast2 e Samba com (AD) Active Directory. Ademais, com toda estrutura 
de gerenciamento da nova rede, esperamos ter como resultado, uma confiabilidade nos 
serviços oferecidos pela empresa leiloeira, maior agilidade nos processos e um melhor 
controle da rede. Além de todo gerenciamento, espera-se ter um bom aproveitamento da 
transmissão ao vivo dos leilões, onde é uma grande necessidade da empresa, devido à 
alta demanda de compradores online. Por fim, a motivação para a realização deste trabalho 
sobre a administração de rede de computadores é demonstrar com as boas práticas de 
utilização das ferramentas necessárias, pode-se tornar o ambiente da internet dentro das 
empresas mais confiáveis através da aplicação de softwares (ferramentas) públicas. 


21 ESTADO DA ARTE 


2.1 Introdução a História da Internet 


A internet é uma ferramenta que se tornou dependência na vida das pessoas, 
seja para o trabalho, lazer, e outras coisas. A internet surgiu durante a Guerra Fria nos 
Estados Unidos cobrindo a necessidade da comunicação entre as bases americanas 
em 1945. Quando se iniciou, se chamava ARPNET, nome derivado da empresa que a 
desenvolveu (Advanced Research and Projects Agency) [STALLING 2007]. Membros da 
MIT (Masschusetss Instite of Technology) tiveram uma ideia: converter toda a linguagem 
da ARPANET para uma linguagem mais humana. Com isso desencadeou os primeiros 
conhecedores de informática, conhecidos como hackers, que foram capazes de criarem 
e desenvolverem os primeiros compiladores da época até chegar os compiladores atuais 
[STALLING 2007]. Com o passar dos anos começaram a nascer problemas de invasões 
em redes de internet nas organizações, com isso em 1994 a IAB (Internet Architecture 
Board) começou a emitir relatórios de arquitetura de internet. Mostrando assim que havia 
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a necessidade de melhorar a segurança da internet. Para se ter uma ideia, na Figura 1 é 
apresentado gráfico com incidentes relatados durante os anos de 1999 até 2015. 
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Figura1 - Gráfico de total de incidentes reportados ao CERT.br por ano. 


Retirado em https:/Avww.cert.br/stats/incidentes/ retirado 27/02/2017. 


2.2 Invasores e Serviços de Segurança 


Hackers são pessoas que constroem ferramentas que auxiliam e facilitam o trabalho 
dos usuários. Normalmente os hackers costumam ter uma ideia de que o acesso à rede da 
internet deve ser ilimitado com o objetivo do autoconhecimento. Em meio a isso, hackers 
cometem crimes de invasões a certos lugares, com o intuito de corrigir problemas que os 
técnicos das organizações desconhecem, ajudando os mesmos a evitar ataques por meio 
de crackers [FILHO 2010]. Por sua vez, crackers são opostos aos hackers. Eles têm apenas 
o entendimento utilizado para o mal, utilizam suas habilidades técnicas e ferramentas com 
intuito de destruir uma rede, piratear programas, jogos e entre outros, e ainda a construção 
de vírus capazes de destruir todas as informações de uma rede [FILHO 2010]. 

Entre alguns serviços de segurança podemos contar com o serviço de autenticação 
de dados, onde se faz com que a segurança de alguns serviços importantes realize a 
autenticação dos dados durante uma comunicação, seja ela uma entidade par onde é um 
serviço utilizado durante uma comunicação ou em fase de transferência de dados. Além 
desta autenticação utiliza-se também a autenticação de origem de dados ao qual provê a 
confirmação da origem dos dados. A autenticação nos assegura que a entidade ao qual 
estamos se comunicando, é realmente aquela que afirma ser [STALLING 2007]. Outro 
serviço importante é o controle de acesso. Ele impede que o uso não autorizado de algum 
recurso dentro da organização trabalhe com a instrução de confidencialidade, ou seja, 


assegura que não haja divulgação dos dados não autorizados e garantindo a proteção de 
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dados durante a conexão e mesmo em uma conexão de um arquivo local [STALLING 2007]. 
Além dos serviços citados, existe o serviço de integridade de dados. Ele garante que os 
dados recebidos durante uma conexão estejam exatamente como foram enviados de uma 
entidade, sem que haja modificação, inserção, exclusão ou repetição de dados [STALLING 
2007]. Ademais, a irretratabilidade é um serviço que oferece uma proteção contra imposição 
ou negação das entidades envolvidas em uma comunicação. É assegurado que a origem 
da mensagem prove ao seu destino que sua mensagem foi recebida por quem enviou sem 
nenhuma ocorrência de desvio durante o caminho até quem vai receber [STALLING 2007]. 


Por fim, a realização do projeto será baseada na arquitetura apresentada na Figura 2. 
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Figura2 - Fluxograma de computadores. 


A rede irá possuir três servidores seguindo as seguintes regras: o principal servidor 
de internet contendo os serviços de Firewall com NetFilter IPTABLES para cuidar da 
segurança utilizando um conjunto de regras criadas pelo administrador da rede, e Squid 
com Proxy Transparente, um serviço para restringir acessos indevidos e armazenar em 
cache páginas já navegadas na rede agilizando a requisição destas páginas, um segundo 
servidor contendo o serviço de DHCP para que seja definido todas as máquinas no mesmo 
protocolo de comunicação TCP/IP usando Ipv4. Este servidor também contará com serviço 
de DNS para resolução de nomes dos sites de forma localmente. Também teremos o servidor 
Samba contendo o serviço de AD e streaming de áudio com Icecast. E para entendermos o 
funcionamento dos servidores, faz-se uma breve explicação de cada serviço. 


2.3 Firewall 


É uma ferramenta de segurança baseada em hardware e software, que junto de 
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um conjunto de regras e instruções, analisa o tráfico de rede durante a transmissão e 
recepção de dados. Neste trabalho, o firewall será construído com o pacote NetFilter 
Iptables, uma ferramenta que cria e administra através de regras filtrando pacotes na rede 
[NETO 2004]. O Iptables poderá funcionar baseado em endereços, portas de origem e 
destino dos pacotes e prioridade, além disso, ele funcionará a partir da comparação de 
regras para saber se um pacote possui ou não permissão para passar. No firewall será 
possível restringir e registrar tudo que estiver acontecendo na rede através de diversos 
logs gerados pelo Iptables. Entre os principais objetivos do Iptables: redirecionamentos 
de portas e serviços, a troca de protocolos (um exemplo ssi3 para tls1), criar regras com 
intuito de bloquear serviços, usuários da rede, acessos por determinado IP, liberações de 
navegação, entre muitos outros serviços [NETO 2004]. 


2.4 Squid 


É uma ferramenta utilizada com diversos objetivos, principalmente impor regras de 
restrição de acesso baseadas no endereço IP da máquina, login, horário e bloqueio de 
conteúdos indevidos. Além disso, ele possui um cache de navegação onde é capaz de 
armazenar todas as páginas e arquivos já acessados em uma memória e quando alguém 
acessar uma página que já foi carregada. O Proxy envia os dados que armazenou no 
cache, sem a necessidade de baixar arquivos da mesma página repetidamente. Isso gera 
uma grande economia de banda e torna o acesso mais rápido sem a necessidade de um 
investimento com uma conexão rápida de internet [WESSELS 2004]. Hoje em dia, muitos 
sites costumam ter um conteúdo dinâmico em suas páginas onde mudam muitas coisas na 
página em cada visita do usuário. 

Mesmo assim, o Proxy ainda é uma forte ferramenta, vendo que conteúdo de HTML 
e animações não mudam e acabam sendo reaproveitados pelo Proxy [MORIMOTO 2006]. 
Outra vantagem na utilização do Proxy é o fato do Squid armazenar todos os acessos 
dando possibilidade ao administrador da rede ver quem acessou, o que acessou e em 
quais horários acessou [MORIMOTO 2006]. Na configuração do Squid mais simples é 
necessário adicionar o Proxy máquina a máquina tornando pouco vantajoso todo esse 
trabalho, mas existe uma forma simples de resolver tudo isso: Proxy Transparente. Com 
isto não existe a necessidade de colocar o Proxy no navegador dos usuários. Uma conexão 
compartilhada via NAT, com a mesma configuração básica nos clientes. Para isso é criado 
uma regra no firewall que faz com que toda navegação na porta 80 seja redirecionada ao 
Squid passando automaticamente através do Proxy, sem que se precise fazer nenhuma 
configuração adicional aos seus clientes [MORIMOTO 2006]. 


2.5 Dynamic Host Configuration Protocol (DHCP) 


É um recurso essencial para distribuir dinamicamente endereços IP e parâmetros 
de rede. Com este serviço as implementações de redes em Ipv4 e Ipv6 apresentam as 
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mesmas funcionalidades básicas, mas com significativas diferenças nas opções que podem 
ser enviadas [ALMEIDA 2000]. O DHCP possibilita uma maior segurança na configuração 
da rede, pois evita erros causados pela necessidade de digitação manual de valores em 
cada computador. Além disso, o DHCP ajuda a impedir conflitos de endereço IP na rede 
causados por um endereço atribuído anteriormente, ou que já esteja sendo utilizado por 
outro computador na rede, mantendo assim um melhor gerenciamento da rede. Usar 
servidores DHCP pode diminuir bastante o tempo gasto na configuração e reconfiguração 
de computadores da rede [TECHNET 2017]. Por exemplo, um cliente, termo utilizado para 
descrever um computador ligado à rede que obtém as configurações do protocolo TCP/IP 
a partir de um servidor DHCP, onde qualquer computador ou dispositivo de rede seja capaz 
de se comunicar com o servidor DHCP e obter as configurações do TCP/IP, é considerado 
um cliente DHCP. Segundo a RFC 2132, publicado pela Internet Engineering Task Force 
— JETF, cliente DHCP é considerado qualquer equipamento que ofereça suporte e seja 
compatível com o comportamento de cliente DHCP [BATTISTI 2013]. 


2.6 Domain Name System (DNS) 


É um serviço de resolução de nomes e domínios em um banco de dados distribuído. 
Permite-se um controle total dos seguimentos que estejam disponíveis em toda a rede 
através de um sistema de cliente-servidor, ou seja, um computador pessoal que faz uma 
pergunta a outro computador que por sua vez se encarrega de encontrar a informação que 
você precisa [CAMPOS 2017]. 


A essência do DNS é a criação de um esquema hierárquico de atribuição de 
nomes baseado no domínio e de um sistema de banco de dados distribuídos 
para implementar esse esquema de nomenclatura (TANEMBAUM 2008, 
p.617). 

Com o serviço DNS é possível efetuar o acesso a sites sem a necessidade de saber o 
seu endereço IP, bastando apenas saber o nome deste site. Todo este trabalho de tradução 
do nome de domínio para o endereço IP é efetuado pelo protocolo DNS. Além da resolução 
de nomes externos, o DNS pode ser utilizado como ferramenta para poder definir nome a 
diversos dispositivos dentro da rede, facilitando que sejam encontrados esses aparelhos 
através dos nomes e não mais apenas pelos seus endereços de IP [CAMPOS 2017]. 


2.7 Samba 


Segundo SILVA (2005), o Samba é um conjunto de ferramentas em um servidor, 
que permite a comunicação entre máquinas executando Linux e Windows, possibilitam o 
compartilhamento de arquivos, diretórios e impressão através do protocolo SMB (Server 
Message Block) e pode atuar como um PDC (Primary Domain Controller), autenticando 
assim usuários de redes locais [MORIMOTO 2006]. O Samba foi através deste protocolo 
para resolver os problemas de comunicação entre um sistema UNIX e um MS DOS, pois 
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para se ter esta comunicação, se fez necessário o uso da interface NetBIOS (Network 
Basic Input Output Sustem) [MORIMOTO 2006]. Toda a configuração do Samba é 
centralizada no arquivo smb.conf. O smb.conf pode ser visto como dividido em três partes: 
a configuração do servidor Samba (parâmetros na seção [global), a configuração dos 
diretórios/pastas pessoais dos usuários (parâmetros na seção [homes!) e as demais seções 
que correspondem aos diretórios compartilhados [ZUCARINO 2001]. 


2.8 AD (Active directory) 


O AD tem como principal função ser um único diretório, onde ao invés do usuário 
possuir várias senhas para cada tipo de serviço disponível na rede (e-mail, sistema da 
empresa, logar no computador), o usuário poderá ter apenas uma senha para acessar 
todos os recursos disponíveis na rede [SANTANA 2014]. Em um ambiente de Tl corporativo, 
o serviço de AD é muito utilizado, sendo o centro para implementação de Serviços de 
Diretório. O AD gerencia os recursos da rede, armazenando informação sobre os recursos 
disponíveis. Com isso facilita a pesquisa e a autenticação [STANEK 2009]. O AD utiliza vários 
protocolos para seu funcionamento, mas segundo STANEK (2009), “o protocolo principal 
para acesso ao AD é o LDAP (Lightweight Directory Access Protocol), um protocolo padrão 
do setor para acesso a diretórios administrativos através do TCP/IP”. Para o funcionamento 
do AD é necessário ter o serviço de DNS disponível na rede, pois o AD utiliza do DNS para 
nomeação dos recursos, e para resolução de nomes na rede [SANTANA 2014]. 


2.9 Icecast2 


É um servidor de streaming de áudio e vídeo, que suporta as extensões Mp3, Opus, 
WebM e Ogg. Pode ser utilizado para criar estações de rádio na internet ou uma transmissão 
ao vivo de eventos e entre outros. Possibilita novos formatos a serem adicionados com 
relativa facilidade e suporta padrões abertos para comunicação e interação [PERMALINK 
2015]. 


31 DESENVOLVIMENTO 


Neste trabalho aplica-se o Oracle VM Virtualbox 5.1.2, para implementação do projeto 
em cinco máquinas virtuais. Tem-se três máquinas virtuais com sistema operacional Debian 
e duas máquinas com sistema operacional Windows XP. Os arquivos de configurações 


estão disponíveis". 


1 https://drive.google.com/drive/folders/1tRpo6Z7IDWjY JOW1x1NvaGorAOXmyELt?usp=sharing 
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3.1 Configurações do Firewall 
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Interface web VirtualBox 5.1.2. 


A configuração do firewall fica no arquivo /etc/init.d/firewall.sh, sendo que é descrito 


cada regra contida no firewall conforme a representação da rede. Por fim, para iniciar o 


serviço utilize o comando /etc/init.d/firewall.sh. 


3.2 Configurações do Squid3 


Configurando arquivo de configuração /etc/squid3/squid.conf. Para finalizar e iniciar 


o Proxy, utilize o comando /et c/init.d/squid3 start. 


3.3 Configurações do DHCP 


Configurando o arquivo de configuração /etc/dhcp/dhcpd.conf. Após, iniciar O serviço 


com o comando /etc/init.d/isc-dhcp-server start. 


3.4 Configurações do DNS 


Iniciando configuração dos arquivos de configuração do Bind9. Iniciar o serviço com 


o comando /etc/init.d/bind9 start. 


3.5 Configuração do Icecast2 


Para finalizar e iniciar o serviço, utilizar o comando /etc/init.d/icecast2 restart. 


3.6 Configurações Samba - AD 


Após, configuração da placa de rede em (/etc/network/interfaces para iniciar a 


configuração do serviço. 
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41 REALIZAÇÃO DOS TESTES 


Para realizações de testes foi verificado se todas as configurações estavam corretas. 
Para tal, abra o CMD via o iniciar do Windows, e digite “ipconfig /all”. Desta forma, obtém-se 
todas as configurações de rede. Endereço do gateway deve ser o IP onde está o firewall 
192.168.0.1, servidor DHCP deve ser 192.168.0.2 e os servidores DNS o endereço do 
servidor com o AD 192.168.0.83. 

Sufixo DNS específico de conexão: redevirtual.local .int 

Endereço de IP: 192.168.0.100 

Máscara de Sub-rede: 255:255.255.0 

Gateway padrão: 192.168.0.1 

Servidores DHCP: 192.168.0.2 

Servidor DNS: 192.168.0.3 

Realizar testes de Ping (Figura 5) para verificar a comunicação com os servidores 
da rede, e observar se todos estão respondendo pelo próprio IP e respondendo pelos 
nomes definidos nas configurações do DNS. 
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Figura5 — Testes de Ping. 
Realizar alguns testes de navegação para verificar as funcionalidades do Proxy 


dentro da rede (Figura 6). Verificar se os bloqueios dentro da rede estão funcionando 
corretamente. 
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Figura6 — Testes de bloqueio do Proxy. 


Testes de verificação da tela web do Icecast2 e verificações de acesso através do 
nome:porta(icecast:8000) configurados no servidor de DNS. Figura 7. 
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Figura” — Interface Web do icecast. 


Testes de criação de usuário no AD gerenciados pelo Windows (Figura 8). 
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Figura8 — Interface de configuração de usuários do AD. 


Realizando testes nas diretivas do AD (Figura 9). 
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Figura9 — Interface configurações das Diretivas de grupo do AD. 
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5 | RESULTADOS OBTIDOS 


Com a implementação destes servidores será obtido um enorme resultado em tudo 
que foi planejado e esperado para o ambiente de trabalho. Através das regras do Iptables 
será possível compartilhar internet com a rede, bloquear portas e evitar perigos da internet, 
liberar portas necessárias para o trabalho com segurança, ativar acessos externos para 
serviços específicos dentro da rede e entre outros. Por sua vez, aplicando o Squid será 
proporcionado uma grande economia de banda de internet na organização, já que os 
principais sites navegados terão suas sintaxes armazenadas no cache do Proxy, bloqueios 
de URL indevidas garantindo a segurança da organização e gerando logs necessários para 
o aprimoramento da rede. O DHCP proporciona a configuração da rede para que todas as 
máquinas sejam configuradas de forma automática e fácil, atribuindo o IP, máscaras de 
rede, gateway e DNS. Além do DHCP, o serviço do DNS irá proporcionar um trabalho de 
resolução de nomes da internet e da rede interna localmente muito interessante, pois com 
essa resolução é possível economizar banda de internet sem a busca de resoluções de 
nomes em algum DNS externo. Agora também poderemos contar com a transmissão ao 
vivo dos serviços da empresa no próprio site, ou em outros domínios com o Icecast. Com 
o serviço do AD, poderemos armazenar e acessar facilmente arquivos da empresa em 


qualquer máquina dentro da rede utilizando apenas uma conexão de rede com o servidor. 


61 CONCLUSÃO 


É importante trabalhar com um risco reduzido e segurança dentro da organização, 
garantindo integridade de arquivos e dados, pois esta implementação é necessária devido 
ao crescimento e avanço da tecnologia e técnicas de segurança de rede. O objetivo deste 
trabalho foi demonstrar a implementação de serviços de segurança para toda a rede 
garantindo a eficácia em diversos ambientes corporativos com ferramentas livres, garantindo 
e convencendo as empresas que o software gratuito proporciona vantagens devido à alta 
qualidade e o baixo custo. Assim, este artigo envolveu o estudo da programação de redes 
de computadores, configurações de servidores Firewall, Proxy, DHCP, DNS, Streamings de 
Áudio, compartilhamento de arquivos de rede. O resultado disto proporciona um enorme 
aprendizado na área de Redes de Computadores. 
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